Вы хотите сделать регрессию, которая будет предсказывать вероятность задержки рейса. В ваших данных есть рейсы со слишком большой и редкой задержкой — до 12 часов. Это портит вашу модель. Как бы вы решали проблему?
Есть несколько вариантов действий,
✔️Исключить выбросы. Можно удалить наблюдения, если они слишком редкие. Но перед этим следует провести статистический анализ, чтобы убедиться, что задержки превышают определённый порог, скажем, 95-й или 99-й процентиль. ✔️Сделать модель более устойчивой к выбросам. Тут можно: ▫️применить регуляризацию ▫️взять другой алгоритм, например деревья решений. ▫️использовать метрики, устойчивые к выбросам: MAE или функцию потерь Хьюбера вместо MSE. ✔️Преобразовать данные. Можно использовать, например, логарифмическое преобразование.
Вы хотите сделать регрессию, которая будет предсказывать вероятность задержки рейса. В ваших данных есть рейсы со слишком большой и редкой задержкой — до 12 часов. Это портит вашу модель. Как бы вы решали проблему?
Есть несколько вариантов действий,
✔️Исключить выбросы. Можно удалить наблюдения, если они слишком редкие. Но перед этим следует провести статистический анализ, чтобы убедиться, что задержки превышают определённый порог, скажем, 95-й или 99-й процентиль. ✔️Сделать модель более устойчивой к выбросам. Тут можно: ▫️применить регуляризацию ▫️взять другой алгоритм, например деревья решений. ▫️использовать метрики, устойчивые к выбросам: MAE или функцию потерь Хьюбера вместо MSE. ✔️Преобразовать данные. Можно использовать, например, логарифмическое преобразование.
#машинное_обучение
BY Библиотека собеса по Data Science | вопросы с собеседований
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
Telegram has no known backdoors and, even though it is come in for criticism for using proprietary encryption methods instead of open-source ones, those have yet to be compromised. While no messaging app can guarantee a 100% impermeable defense against determined attackers, Telegram is vulnerabilities are few and either theoretical or based on spoof files fooling users into actively enabling an attack.
What Is Bitcoin?
Bitcoin is a decentralized digital currency that you can buy, sell and exchange directly, without an intermediary like a bank. Bitcoin’s creator, Satoshi Nakamoto, originally described the need for “an electronic payment system based on cryptographic proof instead of trust.” Each and every Bitcoin transaction that’s ever been made exists on a public ledger accessible to everyone, making transactions hard to reverse and difficult to fake. That’s by design: Core to their decentralized nature, Bitcoins aren’t backed by the government or any issuing institution, and there’s nothing to guarantee their value besides the proof baked in the heart of the system. “The reason why it’s worth money is simply because we, as people, decided it has value—same as gold,” says Anton Mozgovoy, co-founder & CEO of digital financial service company Holyheld.
Библиотека собеса по Data Science | вопросы с собеседований from ar